[livres divers classés par sujet] [Informatique] [Algorithmique] [Programmation] [Mathématiques] [Hardware] [Robotique] [Langage] [Intelligence artificielle] [Réseaux]
[Bases de données] [Télécommunications] [Chimie] [Médecine] [Astronomie] [Astrophysique] [Films scientifiques] [Histoire] [Géographie] [Littérature]

Realisierung und Optimierung einer Data-Mining-Anwendung

title Realisierung und Optimierung einer Data-Mining-Anwendung
creator Bouillet, André
date 2001-05-08
language ger
identifier  http://www.informatik.uni-stuttgart.de/cgi-bin/NCSTRL/NCSTRL_view.pl?id=STUD-1805&engl=1
description 116 pages
In den letzten Jahren ist die täglich anfallenden Menge an Daten kontinuierlich gestiegen. Hieraus entstand das Problem, dass das Informationsangebot für das Unternehmensmanagement zunimmt, und dessen Versorgung mit den entscheidungsrelevanten Daten zunehmend erschwert wird. Neben OLAP hat sich als eine weitere Möglichkeit Informationen aus diesen großen Datenmenge zu extrahieren, das "Data Mining" entwickelt. Diese Arbeit beschäftigt sich zunächst mit den Grundlagen des Data Mining, insbesondere mit dem Mining-Ablauf und den unterschiedlichen Mining-Algorithmen. Daneben wird die Vorgehensweise zur Implementierung einer Data-Mining-Anwendung mit Hilfe des "Intelligent Miner for Data" von IBM auf bestehenden Daten betrachtet. Hierzu wird die Datenbasis des TPC-H-Benchmarks verwendet. Weiterer Schwerpunkt dieser Arbeit ist die Untersuchung unterschiedlicher Optimierungsmöglichkeiten auf Datenbankseite zur Beschleunigung der Analyselaufzeiten. Hierzu wird der Einfluß von Implementierungsaspekten, wie die Verwendung von Views, materialisierten Tabellen oder Summary Tables betrachtet. Zusätzlich wird auch auf die Auswirkungen der Attributanzahl der zu analysierenden Relationen eingegangen. Als ein weiterer Punkt wird die Verwendung von Indizes untersucht. Der Abschluß dieser Arbeit vergleicht die Laufzeiten der zuvor identifizierten Optimierungsansätze.
publisher Stuttgart, Germany, Universität Stuttgart
type Text
Student Thesis
source ftp://ftp.informatik.uni-stuttgart.de/pub/library/medoc.ustuttgart_fi/STUD-1805/STUD-1805.ps
contributor Anwendersoftware (IPVR)
format application/postscript
13605899 Bytes
subject Database Applications (CR H.2.8)
Information Search and Retrieval (CR H.3.3)
Information Storage and Retrieval Systems and Software (CR H.3.4)
Information Systems Applications Types of Systems (CR H.4.2)
relation Student Thesis No. 1805